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(54) Title: METHODS FOR CHARACTERISING mRNA MOLECULES 

(54) Bezeichnung: VERFAHREN ZUR CHARAKTERISIERUNG VON mRNA-MOLEKtlLEN 
(57) Abstract 

The invention relates to methods for the qualitative and quantitative determination of differentially expressed mRNA molecules. Said 
methods are used especially to determine if possible all mRNA molecules present in a cell or a tissue, and to compare them with other 
cells or tissues or with other conditions (stages of disease or development) or stages of treatment for same. The method provided for in the 
invention therefore makes it possible, for example, to establish a comprehensive map of the different mRNA molecules present in a defined 
mRNA population and subsequently to use the preferably digital information obtained in this way in data base analyses. 

(57) Zusammenfassung 

Die vorliegende Erfindung betrifft Verfahren zur qualitativen und quantitativen Erfassung differentiell exprimierter mRNA-Molektile. 
Diese Verfahren dienen insbesondere der Erfassung moglichst aller in einer Zelle oder in einem Gewebe vorliegenden mRNA-Moleklile 
sowie deren Vergleich mit anderen Zellen oder Geweben oder mit bestimmten Zustanden (Krankheits- Oder Entwicklungsstadien) oder 
Behandlungsphasen derselben. Das erfindungsgemasse Verfahren erlaubt somit z.B. die Erstellung eines umfassenden Abbildes der in einer 
definierten mRNA-Population vorliegenden verschiedenen mRNA-Molektile sowie die anschliessende Verwendung der hierbei erhaltenen, 
vorzugsweise digitalen Information im Rahmen von Datenbankanalysen. 
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Verfahren zur Charakterisieruna von mRNA-Molekulen 

Die vorliegende Erfindung betriffi Verfahren zur qualitativen und quantltativen Erfassung 
differentiell exprimierter mRNA-Molekule. Die der Erfindung zugrundeiiegende Technik wird 
nachfolgend kurz mit DEPD (Digital Expression Pattern Display) bezeichnet. 

Das Genom hoherer Organismen umfasst nach gegenwartigen Schatzungen etwa 100.000 
verschiedene Gene, von denen jedoch nur eine vergleichsweise kleine Anzahl in jeder Zelle 
eines Organismus exprimieri und damit in Polypeptide und Proteine umgesetzt wird. Es wird 
davon ausgegangen, dass weitgehend alle Prozesse und Stoffwechselleistungen irn 
Bereich der lebenden Materie davon abhangen, welche Gene zu welchem Zeitpunkt in 
welchen Gewecen an- bzw. abgeschaltet werden. So weisen zahlreiche Befunde darauf 
hin, dass zellulare Prozesse wie beispielsweise Homoostase, Reaktionen auf Allergien, 
Regulation des Zellzyklus, Altern und das Eintreten von Zellen in den programmierten 
Zelltod (Apoptose) auf der differentiellen Expression bestimmter Gene basieren Oder hiermit 
im Zusammenhang stehen. Sowohl der Verlauf einer normalen Entwicklung als auch die zu 
Erkrankungen wie z.B. Krebs funrenden pathologischen Erscheinungen beruhen im 
wesentlichen auf Veranderungen in der Genexpression. 

Dementsprechend besteht Bedarf an spezifischen Verfahren zur Erfassung unterschiedlich 
bzw. differentiell exprimierter mRNA-Molekule, um Unterschiede in der Genexpression im 
Vergleich zu geeigneten Kontrollen zu identifizieren. Derartige Verfahren waren sowohl 
diagnostisch als auch im Wege der Evaluierung therapeutischer Targets von grosser 
Bedeutung. 

Das erfindungsgemasse Verfahren dient insbesondere der Erfassung moglichst aller in 
einer Zelle oder in einem Gewebe vorliegenden mRNA-Molekule sowie deren Vergleich mit 
anaeren Zellen oaer Geweben oder mit bestimmten Zustanden (Krankheits- Oder 
Entwicklungsstadien) oder Behandlungsphasen derselben, und zwar vorzugsweise sowohl 
in qualitativer als auch in quantitativer Hinsicht Das erfindungsgemasse Verfahren erlaubt 
somit z.B. die Erstellung eines umfassenden Abbildes der in einer definierten mRNA- 
Population vorliegenden verschiedenen mRNA-Molekule sowie die anschliessende 
Verwendung der hierbei erhaltenen, vorzugsweise digitalen Information im Rahmen von 
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Datenbankanalysen. Es ist davon auszugehen, dass in naher Zukunft alle humanen 
Gensequenzen in entsprechenden Datenbanken zur Verfugung stehen werden. Das 
vorliegende Verfahren erlaubt deshalb die gesamtheitliche Erfassung und Charakteri- 
sierung von zellularen Vorgangen, die sich in spezffischen Expressjonsmustern auf der 
Ebene der mRNA-Populationen wiederspiegeln. Hierdurch konnen beispielsweise 
Veranderungen im Expressionsmuster einzelner, an einem spezifischen.Prozess beteiligter 
Gene schnell und verlasslich identifiziert werden. Dadurch lassen sich auch neue 
Substanzwirkzieie fur pharmazeutische Wirkstoffe definieren. Die erhaltenen Informationen 
konnen auch eingesetzt werden, um iiber nachvollziehbare biochemische Signal- bzw. 
Synthesewege den kausaien Zusammenhang zwischen bekannten Zieigenen und 
Zielproteinen herzustellen. 

Dem Fachmann auf dem betreffenden Gebiet ist die oben dargelegte Aufgabenstellung 
bekannt. Im Stand der Technik sind zur Losung der gestellten Aufgabe verschiedene Wege 
beschritten worden. • .. .•«.- 

Beispielsweise beschreiben P. Liang und A.B. Pardee ein Verfahren zur Tennung 
individueller mRNAs mittels Polymerase-Kettenreaktion (PCR) (P. Liang & A.B. Pardee 
1992 Science 257, 967-971). Dieses Verfahren wurde angewendet, um die von zwei 
verwandten Zelltypen exprimierten mRNA-Populationen zu vergleichen. Eine Auftrennung 
der komplexen Mischung aus mRNA-Molekulen in Fraktionen, jeweils bestehend aus 50- 
100 Genen der totalen Population, wurde erreicht durch: 1) reverse Transkription der mRNA 
in einzelstrangige cDNA mit 12 sogenannten 3'-Anker-Primern der Form T n1 VN (wobei T„= 
elf aufeinanderfolgende T's, V = A, C, G; N = A, C, G, T); 2) PCR-Amplifikation jeder 
einzelnen cDNA-Fraktion mit dem entsprechenden 3'-Ankerprimer und einem willkurlich 
gewahlten 10 Nukleotide umfassenden 5'-Oligomer in Gegenwart von radioaktiv markierten 
Desoxyribonukleotiden. Die Produkte wurden auf Sequenziergelen aufgetrennt und es 
wurden 50-100 Banden im Grossenbereich von 100-500 Nukleotiden beobachtet. Die 
Banden resultierten aus der Amplifikation von cDNAs, die mit den 3'-Enden von mRNAs 
korrespondieren, weiche das Komplement des 3'-Ankerprimers sowie des willkurlich 
gewahlten 5 '-Oligomers enthielten. Fur jedes Primerpaar waren die Muster der aus beiden 
cDNAs amplifizierten Banden ahniich, wobei die Intensitaten von etwa 80 % der Banden 
nicht unterscheidbar waren. Bestimmte Banden traten in dem einen oder anderen PCR- 
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Ansatz starker in Erscheinung, wahrend einige lediglich in einem der beiden Ansatze 
nachweisbar waren. 

Werin samtliche der fur Saugetiere erwarteten 50.000-100.000 verschiedenen mRNAs mit 
den willkiirlich gewahlteri 5'-Primern (abitrary primer) erfassbar waren, dann ware eine 
Anzahl vori 80-95 solcher Oligonukleotide und ca. 1 .000 PCRS notwendig, urn mit hoher 
Wahrscheinlichkeit etwa zwei Dritteldieser mRNAs zu detektieren. Aus zahlreichen 
Untersuchen der letzten Jahre hat sich gezeigt, dass' das bben dargestellte Verfahren zu 
einer hoheh Rate (bis 90 %) von failsch-positiven Signaleri fuhrt. 

Die WO 95/13369 offenbart ein Verfahren (TOGA - TOtal Gene Expression Analysis) zur 
gleichzeitigen identifizierung differentiell exprimierter mRNAs und zur Messung deren 
relativer Konzentrationen. Das Verfahren basiert auf der Erstelluhg doppelstrangiger cDNA 
aus isoiierter mRNA tinter d&r Venwenduhg eines spezifischen Sets ah Oligo (dT)«Primern. 
Dabei wird eine Mischung aus 1 2 Ankerprimern mit der folgenden Struktur eingesetzt: von 
5* beginnend folgt einem "Stuffer"- oder "Heer-Fragment von 4-40 Basen eine 
Erkennungssequenz fur eine Restriktionsendonuklease (typischerweise Notl), 7-40 dT- 
Nukleotide und schhesslich zwei "Ankerbasen" V, N am 3'-Ende des Primers. Dabei 
bezeichnet V ein Desoxyribonukleotid der Gruppe dA, dC oder dG, wahrend N die 
Desoxyribonukleotide dA, dC, dG und dT definiert. Die auf diese Weise erhaltene cDNA 
wird anschliessend mit einem Restriktionsenzym, welches 4 Basen als Sequenz fur die 
SchnHtstelle erkennt (z.B. Mspl), vollstandig verdaut, mii Notl geschnitten und in einen 
entsprechend behandelten Plasmid-Vektor kloniert. Die Orientierung des Inserts ist dabei 
"antisense" relativzu einem Vektor-kodierten, Bakteriophagen-spezifischen Promotor 
(typischerweise T3). Die Ligationen werden in einen E.coli-Stamm transformiert, wodurch 
cDNA-Banken generiert werden. Die Plasmid-DNA dieser cDNA-Bibliotheken wird isoliert 
und mit Hilfe von Kombinations-Verdaus durch 6 unterschiedliche Restriktionsenzyme, die 
von den oben verwendeten verschieden sind, linearisiert. Die linearisierte cDNA wird durch 
die T3-Polymerase in cRNA ubersetzt und anschliessend in 16 Sub-Fraktionen 
einzelstrangiger cDNA transkribiert. Dabei wird eine thermostabile reverse Transkriptase bei 
hoher Temperatur und je einer von 16 verschiedenen cRNA-Primem, dessen beiden 3'- 
Nukleotide aus einer vollstandigen Permutation der 4 moglichen Desoxyribonukleotide dA, 
dC, dG und dT besteht, venvendet. Die Produkte der 16 cDNA-Fraktionen werden als 
Template fur PCR eingesetzt unter Verwendung eines 3'-Oligonukleotides f welches einer 
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Vektor-Sequenz nahe der Klonierungsstelle des Inserts entspricht, und einem 5'-Oligomer, 
das einem der 16 cDNA-Synthese-Primer mit zusatzlich zwei 3'-Nuk!eotiden der 
vollstandigen Permutation der 4 moglichen Desoxyribonukleotide dA, dC, dG und dT 
entspricht. So werden bis zu 256 verschiedene Pools gsneriert, deren radioaktiy markierte 
Banden (35S-dATP oder 32P-dCTP) auf Polyacrylamid-Gelen analysiert werden. Aufgrund 
der erhaltenen information uber die Lange und Zusammensetzung der 8 identifizierten 
Basen einer markierten Bande soil es theoretisch moglich sein, ohne Klonierungs- und 
Sequenzierungsschritte auf die Identifikation des zugehdrigen Gens in einer kompletten 
Datenbank zu schliessen. 

Die obsn dargelegte Methodik wirft folgende Probleme im Zusammenhang mit der 
erfindungsgemass angestrebten hohen Spezifitat, Selektivitat und Reproduzierbarkeit auf: 

1) potentieller Vertust von cDNA-Sequenzen durch Notl-Verdau; 

2) potentieller Verlust von cDNA-Sequenzen durch VekiOr-Ligation; 

3) potentieller Verlust von cDNA-Sequenzen durch Transformation in E.coli und 
unterschiedliche Amplifikationsraten fur verschiedene cDNA-lnserts; 

4) Kontamination der PCR-Templates mit bakterieller genomischer DNA nach Plasmid- 
Amplifikation und Reinigung aus E.coli; 

5) Kontamination der Templates fur die T3-RNA-Poiymerase-Reaktion mit Insert-freier 
Plasmid-DNA; 

6) Verlust von cDNA-lnserts durch kombinierte Linearisierungs-Verdaus mit 6 
unterschiedlichen Restriktionsendonukleasen; 

7) Verlust von cDNA-Sequenzen durch cRNA-Synthese-Amplif ikation; 

8) Verlust von cDNA-Sequenzen durch die zweite cDNA-Synthese-Amplif ikation ; 

9) Fragliche Spezifitat der themriostabilen reversen Transkriptase fur die permutierten 
Primer, die fur die zweite cDNA-Synthese eingesetzt werden, da die Selektivitat der 
reversen Transkriptase bei Basen-Misspaarung im allgemeinen ca 10-1 .000-fach (fur AMV- 
RT) unterhalb der Selektivitat der Taq-Polymerase liegt (L.V. Mendelman et al. 1990, J. 
Biol. Chem. 265, 2338-2346); 

10) Fragliche Selektivitat der Taq-Polymerase fur die verwendeten permutierten 5'- 
Oligomere in der PCR unter den beschriebenen Bedingungen, da Basenmisspaarungen bei 
den eingesetzten Primern toleriert werden. Die korrekte Analyse der Informationen ist 
deshalb nicht gewahrleistet. 
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M. Matz et al. beschreiben ein weiteres Verfahren (ODD - ordered differential display - 
1997, NucL Acid. Res. 25, 2541-2542) zur Identifizierung differential exprimierter Gene, 
weiches auf der PCR-Amplifikation durch Adaptor-spezifische Oligonukleotide und dem 
Effekt der PCR-Suppression beruht. Hierbei wird doppelstrangige cDNA unter Vervyendung 
eines Olfgonukleotides der Struktur "Heel-dT(1-3). B erzeugt, wobei "Hee!" eine Folge von 12 
Basen darstellt. Die cDNA wird von einem Restriktionsenzym mit einer 4 Basen 
unrrfassenden Erkennungssequenz (Rsal) vollstandig verdaut und mit einem Tseudo- 
Doppelstrang-Adaptor" ligiert. Dieses Molekul besteht aus einem langeren (39 Basen) und 
einem kurzeren (12 Basen komplementar zum 3'-Ende des langeren) Oligomer, welche 
unter geeigneten Bedingungen gegeneinander hybridisiert werden. Die 5'-Enden der 
Oligonukieotide sind dabei nicht phosphoryliert Theoretisch ist so in einer 1 . PCR die 
spezifische Amplication der 3'-Enden der cDNA mit Hilfe des cDNA-Synthese-Primers und 
eines Primers, der dem 5'-Ende des langeren Adaptor-Oligomers entspricht, bei hoher 
Annealing-Temperatur in der PCR (85 S C) moglich. Eine Auftrennung der komplexen cDNA 
in unterschiedliche Fraktionen wird in einer 2. PGR erreicht. Dabei wird der cDNA-Synthese- 
Primer mit zusatzlich zwei 3'-Nukleotiden der vollstandigen Permutation aller vier 
Desoxyribonukleotide dA, dC, dG und dT und ein Primer, welcher dem 3'-Ende des 
langeren Adaptor-Oligomers mit zusatzlich zwei 3'-Nukleotiden der vollstandigen 
Permutation aller vier Desoxyribonukleotide dA, dC, dG und dT entspricht, verwendet. Fur 
eine erhohte Spezifitat des Adaptor-Primers wurde eine artifizielle Misspaarung (Mismatch) 
in das Oligonukleotid an der Position -4 relativ zum 3'-Ende des Primers eingefuhrt. 

Die oben dargelegte Methodik wirft folgende Probleme im Zusammenhang mit der 
erfindungsgemass angestrebten hohen Spezifitat, Selektivitat und Reproduzierbarkeit auf: 

1) Die Venvendung eines nicht-geankerten cDNA-Synthese-Primers erlaubt keine Garantie 
der Reproduzierbarkeit der gefundenen Fragmentlangen; 

2) Die Amplifikation der 3'-Enden der cDNA unter Verwendung eines Oligomers der 
Struktur "Heel-dT(13)" bei hohen Annealing-Temperaturen in der PCR ist nicht 
reproduzierbar; 

3) Die seiektive Amplifikation der 3'-Enden der cDNA , durch Verwendung eines "Pseudo- 
Doppelstrang-Adaptors" ist nichi gesichert; 

4) Die erhohte Spezifitat in der 2. PCR fur die permutierten 5 '-Oligonukleotide durch die 
Einfuhrung ejnes artffiziellen Mismatches ist unbefriedigend; 
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5) Die in der 2. PCR eingesetzten 3'-Oligomere enthalten keinen artifiziellen Mismatch und 
sind daher nicht ausreichend seiektiv fur die Primer-Permutation; 

6) Durch die spezielle Anordnung der PCR ist die aus der Gel-Analyse erhaltene 
Information fiber die einzelnen DNA-Fragmente (Fragmentlange und. 6 bekannte 
Nukleotide) ohne zusatzliche Klonierungs- bzw. Sequenzierungschritte nicht ausreichend. 

Y. Prashar und S. Weissman (1996, Proc. Natl. Acad. Sci. USA 93, 659-663) beschreiben 
ein Verfahren, bei weichem doppelstrangige cDNA mittels 1 2 Oligonukleotiden hergestellt 
wird, die folgende Struktur aufweisen: von 5' beginnend folgt einer "Heel"-Struktur eine 
Folge von 18 dT-Nukleotiden und zwei "Ankerbasen" V, N am 3'-Ende des Primers. Dabei 
bezeichnet V ein Desoxyribonukleotid der Gruppe dA, dC Oder dG, wahrend N die 
Desoxyribonukleotide dA, dC, dG und dTdefiniert. Die cDNA-Synthese erfolgt bei einer 
Temperatur von 50°C und soil eine Aufteilung der komplexen Mischung in 12 
unterschiediiche Pools ermoglichen. Nach vollstandigem Verdau der cDNA mit 
verschiedenen Restriktionsendonukleasen, welche sechs Nukleotide als Sequenzfiir die 
Schnittstelle erkennen, werden die entstandenen DNA-Fragmente mit einem Adaptor 
versehen, welcher die Struktur eines Ypsilons aufweist. In der nachfolgenden PCR wird ein 
3'-Primer verwendet, der an die "Heel"-Struktur der cDNA bindet. Als 5'-Primer wird ein 
Oligonukleotid eingesetzt, dessen Bindungsstelle in der ausseren Region des Ypsilon- 
Adaptors liegt und die erst entsteht, wenn in einer ersten Synthese der komplementare 
Strang zu dieser Region gebildet wird. Alle Fragmente, welche auf beiden Seiten einen 
Ypsilon-Adaptor besitzen, konnen nicht amplifiziert werden. 

Die von den Autoren behauptete Auftrennung der cDNA-Produkte in unterschiediiche 
Fraktionen ist durch die verwendeten, am 3'-Ende permutierten cDNA-Synthese-Primer 
nicht reproduzierbar. Zudem konnen durch die Verwendung der spezielien Adaptor-Struktur 
keine permutierten PCR-5'-Primer eingesetzt werden. 

Die WO 97/2921 1 beschreibt die Technik 'Restriction Display (RD-PCR)", bei welcher 
doppelstrangige cDNA mittels 12 0ligonukleotiden hergestellt wird. Diese Primer weisen 
folgende Struktur auf: von 5' beginnend folgen einer "Heer-Struktur zwei Desoxynukleotide 
der vollstandigen Permutation, aller vier Desoxyribonukleotide dA, dC, dG und dT, eine 
Folge von 17 dT-Nukleotiden und zwei "Ankerbasen" V, N am 3'-Ende des Primers. Dabei 
bezeichnet V ein Desoxyribonukleotid der Gruppe dA, dC Oder dG, wahrend N die 
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Desoxyribonukleotide dA, dG, dG'und dT definiert. Nach vollstandigem Verdau der cDNA 
mit einem oder mehreren Restriktions-Endonukleasen wird ein Adaptor-Molektil an die 
cDNA-Fragmente ligiert. In einer sich anschliessenden PCR wird ein 3-Primer verwendet, 
der seiektiv ah die "Heer'-Siruktur der cDNA bindet lind zusatzlich zwei 3'-Nukleotide V, N 
am 3'-Ende des Primers' besitzt. Dabei bezetcbnetA/ ein Desoxyribonukleotid der Gruppe 
dA, dC oder dG, wahrend N die Desoxyribonukleotide dA, dC, dG und dT definiert. Als 5'- 
Primer wird ein der 3'-Sequenz des Adaptor-Primers entsprechendes Oligonukleotid 
eingesetzt, welches zusatzlich ein 3'-Nukleotid oder zwei 3*-Nukleotide oder drei 3'- 
Nukleotide der vollstandigen Permutation aller vier Desoxyribonukleotide dA, dC, dG und dT 
aufweist. Die PCR wird dabei mit unterschiedlichen Permutations-Kombinationen derart 
durchgefuhri, dass in einer ersten PCR (oder in den ersten 10-25 PCR-Zyklen) 5'-Primer mit 
nur einer Permutation und anschliessend in einer zwetteri PCR (oder in den restlichen PCR- 
Zyklen) 5'-Primer mit nur zwei oder drei Permutationen eingesetzt werden. Hierdurch soil 
die Seiiektivitat f ur die verschiedenen S'-Primer-Permuationen deutlich erhoht werden. 

Die oben dargeiegte Methodik wirft folgende Probleme im Zusammenhang mit der 
erfindungsgemass angestrebten hohen Spezifitat, Selektivitat und Reproduzierbarkeit auf : 

1) Die Verwendung von verschiedenen cDNA-Synthese-Primern mit 3'-Permutationen ist 
nicht seiektiv und erlaubt daher keine Garantie der Reproduzierbarkeit der Methode; 

2) Die Aufteilung des Amplifikationsschrittes in mehrere PCR-Runden mit S'-Primern,, 
welche eine unterschiedliche Anzahl an 3'-Permutationen aufweisen, ist allein fur sich nicht 
Sequenz-selektiv genug, um die Technik z.B. in einer Datenbank-orientierten Gen- 
Expressions-Analyse einzusetzen. 

Kato beschreibt ein Verfahren ('molecular indexing' - 1995, Nucl. Acids Res., Vol. 23, 3685- 
90 und 1996, Nucl. Acids Res., Vol. 24, 394-95), das auf dem Verdau der doppelstrangigen 
cDNA mit Restriktionsendonukleasen der Klasse IIS beruht Diese generieren S'-Uberhange 
der cDNA von unbekannter Sequenz. Es werden dann 64 biotinylierte Adaptoren, deren 
Nukleotide 2-4 (relativ zum 5'-Ende) ihrer 5-Uberhange komplementar zu je einem 64-stel 
des gesamten cDNA-Pools sind, mit DNA-Ligase aus E.coli ligiert. Das jeweilige 5'- 
Nukleotid der Adaptoren-Uberhange bleibt undefiniert. Die dabei ligierten cDNA-Fragmente 
werden uber die Bindung an Streptavidin-gekoppelte magnetische Partikel gereinigt. In 
einer sich anschliessenden PCR werden die Adaptdrrligierten S'-Enden der cDNA unter 
Verwendung eines Adaptor-Oligonukleotids und eines Oligo-(dT)-Oligomers, welches am 3'- 
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Ende urn eines der drei Nukleotide dA, dC oder dG verlangert ist, bei geringer Anneaiing- 
Temperatur amplifiziert. Die cDNA wird derart in 192 unterschiediiche Pools aufgetrennt. 
Auch diese Methodik wirft folgende Probleme im Zusammenhang mit der erfindungsgemass 
angestrebten hohen Spezifitat, Selektivitat und Reproduzierbarkeit auf : 

1) Die Ligation von Adaptoren mit vier Nukleotiden als S'-Uberhang ist ohne weitere 
Nachbehandtung nicht Permutations-spezrfisch genug, urn mit Sicherheit die ersten drei 
oder vier Basen des cDNA-lnserts bestimmen zu konnen; 

2) Urn eine moglichst hohe Ligationsspezifitat zu erreichen, wird nur eine sehr geringe 
Menge an Adaptor-Molekul in die Ligation eingesetzt, was jedoch zu deutlich verringerter 
Ligations-Effizienz fuhrt. Dies wiederum hat zur Folge, dass die Sensitivitat der gesamten 
Methode reduziert wird; 

3) Die Aufteilung der cDNA in Pools unter Verwendung von geankerten Oligb-(dT)-Primern 
bei geringer Annealing-Temperatur in der PCR ist nicht erfoigreich durchfuhrbar. 

Aufgrund der geschilderten Nachteile der oben dargestellten Techniken des Standes der 
Technik, insbesondere in Bezug auf die mangelnde oder nur geringe Reproduzierbarkeit 
und Sequenz-Spezifitat wahrend der PCR-Amplifikation der 3'-Enden der cDNA, ergibt sich 
die Noiwendigkeit der Entwicklung und Etablierung eines Verfahrens, welches den 
bekannten Verfahren beziiglich Spezifitat, Seiektivitat, Sensitivitat und verlasslicher 
Reproduzierbarkeit sowie reduzierter Fehlerrate der erhaltenen Ergebnisse deutlich 
uberlegen ist. Diese Kriterien sind insbesondere dann erforderlich, wenn z.B. eine 
Datenbank-gestutzte Analyse zur differentiellen Gen-Expression mittels digitalem Display 
durchgefuhrt werden soil. 

Erfindungsgemass wird daher ein Verfahren zur Identifikation und Charakterisierung von 
mRNA-Molekulen bereitgestelit, welches die folgenden Schritte umfasst: 

(a) Isolierung und Reinigung von PolyA + -RNA aus Gewebeproben; 

(b) Synthese von doppelstrangiger cDNA aus den mRNA-Molekulen; 

(c) Verkurzen der cDNA durch enzymatischen Verdau mit Restriktionsendonukleasen; 

(d) Hybridisierung und Ligation von Adaptor-Molekulen an die geschnittene cDNA; 
und entweder, in einer 1 . Alternative, 
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(e) Auffullen der 5-Uberhange der cDNA mit Desoxyribonukleotiden und Klenow-DNA- 
Polymerase; 

(f) selektive Aufreinigung der 3'-Enden der cDNA; 

(g) Abtrennung der 3-siandigen Poly-dA-Nukleotide der cDNA durch enzymatischen 
Verdau mit einer Restriktionsendonuklease; 

(h) Hybridisierung und Ligation von Adaptor-Molekulen an die geschnittene cDNA; 

(i) Amplifizierung der cDNA-Fragmente durch PCR (polymerase chain reaction); 
(j) Auftrennung der Amplffikationsprodukte nach ihrer Lange; 

(k) Analyse der Amplifikationsprodukte; 
oder, in einer 2. Alternative, 

(e) selektive Aufreinigung der 3'-Enden der cDNA; 

(f) Abtrennung der 3'-standigen Poly-dA-Nukleotide der cDNA durch enzymatischen 
Verdau mit einer Restriktionsendonuklease; 

(g) Hybridisierung und Ligation von Adaptor-Molekulen an die geschnittene cDNA; 

(h) Amplifizierung der cDNA-Fragmente durch PCR (polymerase chain reaction), 
wobei 5-Primer verwenaet werden, die zwei oder drei Permutationen am 3'-Ende 
aufweisen. und die eine oder zwei artifizielle Fehlpaarungen im Vergleich zum durch 
die Adaptermolekule bestimmten komplementaren Strang enthalten; 

(i) Auftrennung der Amplifikationsprodukte nach ihrer Lange; 
(j) Analyse der Amplifikaxionsprodukte; 

oder, in einer dritten Alternative, 

(e) Amplifizierung der cDNA-Fragmente durch PCR (polymerase chain reaction), 
wobei 5-Primer verwendet werden, die zwei oder drei Permutationen am 3'-Ende 
aufweisen, und die eine oder zwei artifizielle Fehlpaarungen im Vergleich zum durch 
die Adaptermolekule bestimmten komplementaren Strang enthalten; 

(f) Auftrennung der Amplifikationsprodukte nach ihrer Lange; . 

(g) Analyse der Amplifikationsprodukte; 

wobei fur die 1. und 2. Alternative in Schritt (b) die Synthese der cDNA- 
Erststrangmolekiile durch reverse Transkription unter Verwendung eines geankerten 
Oligo-dT-Nukleotids erfotgt, welches eine S'-Extension von 2 Basen aufweisi, wobei 
die erste Base dA, dC Oder dG, und die zweite Base dA, dC, dG oder dT ist, und 
welches eine 5'-Extension von 5-1 5, bevorzugt von 6-15, Basen aufweist, die fur die 
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Schnittstelle einer Restriktionsendonuklease mit der Spalt-Charakteristik 16/14 
'downstream* der Erkennungssequenz kodiert; oder 

wobei fur die 3. Alternative in Schritt (b) die Synthese der cDNA-Erststrangrnolekule 
durch reverse Transkription unter Verwendung sines geankerten. Ojigo-dT-Nukleotids 
erfolgt, welches eine 3'-Extensicn von 2 Basen aufweist, wobei die erste Base dA, dC 
oder dG, und die zweite Base dA, dC, dG oder dT ist, und welches eine S'-Extension 
von 5-15 Basen einer beliebigen Sequenz aufweist. 

Enzyme mit der Spaltcharakteristik 16/14 "downstream" der Erkennungssequenz sind dem 
Fachmann bekannt. Beispiel sind Eco571 und Bsg1 (siehe beispielsweise A. Janulaitis et 
ai., Nucleic Acids Res. 20 (1992), S. 6043-6049; Petrusyte et al., Gene 74 (1988), S. 89- 
91). 

Bevorzugt ist in dem erfindungsgemassen Verfahren das Qligo-dT-Nukieotid vollstandig 
durch 2'-0-methyiierte Ribonukleotide substituiert Alternativ kann das Oligo-dT-Nukleotid 
aus Standard-Desoxyribonukleotiden bestehen. 

Weiter bevorzugt ist in dem erfindungsgemassen Verfahren, dass das Oligo-dT-Nukleotid 
an seinem freien 5'-Ende und/oder an internen dT-Nukleotiden mit einem Biotinrest uber 
einen C9-Spacer versehen wird. 

Eine bevorzugte Ausfuhrungsform betrifft ein erfindungsgemasses Verfahren, wobei in 
Schritt (h) der 2. Alternative oder in Schritt (e) der 3. Alternative sich die Fehlpaarungen an 
den Positionen -3, oder -3 und -4, oder -4 und -5 im Vergleich zum durch die 
Adaptermolekule bestimmten kompiementaren Strang befinden. 

Eine weitere bevorzugte Ausfuhrungsform des erfindungsgemassen Verfahrens ist dadurch 
gekennzeichnet, dass in Schritt (c) ein Restriktionsenzym der Klasse IIS verwendet wird, 
welches 5 Nukleotide als Erkennungssequenz besitzt und einen aus 2 - 4, insbesondere 4, 
Nukleoiiden, die nicht TeiLdef Erkennungssequenz sind, bestehenden Uberhang der 
geschnittenen cDNA-Fragmente generiert. 

Eine weitere bevorzugte Ausfuhrungsform des erfindungsgemassen Verfahrens ist dadurch 
gekennzeichnet, dass in Schritt (f) der 1 . Alternative oder in Schritt (e) der 2. Alternative die 
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selektive Aufreinigung der 3'-Enden der cDNA unter Verwendung von paramagnetischen 
'beads* erfolgt, die das Biotin-bindende Molekul Streptavidin gekoppelt haben. 

Bevorzugt wird in Schritt (g) der 1v Alternative Oder in Schritt (f) der 2. Alternative des 
erfindungsgemassen Verfahrens ein RestriktionsenZym der Klasse IIS verwendet wird. 

Waiter bevorzugt werden die Produkte aus Schritt (d) Oder aus Schritt (h) der 1 . Alternative 
Oder aus Schritt (g) der 2. Alternative des erfindungsgemassen Verfahrens vor der 
Ampiifizierung gemass Schritt (i) rnit einer Nuklease; ausgewahlt aus der Gruppe bestehend 
aus T4-Endonuclease VII, S1 -Nuclease, und Mung Bean Nuclease, inkubiert werden. 

Ferner ist das erfindungsgemasse Verfahren bevorzugterweise dadurch gekennzeichnet, 
dass in Schritt (i) der ersten Alternative Oder in Schritt (h) der 2. Alternative Oder in Schritt 
(e) der 3. Alternative die Ampiifizierung der cDNA-Fragmente unter Verwendung von - 
Oiigonukleotiden erfolgt, die an deri koririp1enrientareh« Strang des 'sense'-Oligomers der 
ligierten Adaptor-Molekule hybridisieren. 

Das erfindungsgemasse Verfahren ist weiter bevorzugt dadurch gekennzeichnet, dass in 
Schritt (k) der ersien Alternative Oder in Schritt (j) der 2. Alternative oder in Schritt (g) der 3. 
Alternative die Analyse anhand der unterschiedlichen Langen der Produkte sowie in 
Kenntnis der durch die Manipulation bekannten Basensequenz von 9 oder 10 Nukleotiden 
erfolgt. 

Eine weitere bevorzugte Ausfuhrungsform betrifft die Anwendung des erfindungsgemassen 
Verfahrens nach einem der vorhergehenden Anspruche zur gegebenenfalls 
rechnergestutzten Identifizierung und Isolierung sowie Analyse neuer Gene. 

Das erfindungsgemasse Verfahren DEPD wurde entwickelt, urn die Fehlerrate bei der 
Identifizierung einiger Nukleotide der cDNA-Fragmente, welche wiederum die Identifizierung 
des kodierten Gens in einer geeigneten Datenbank zulassen, deutlich zu reduzieren. 
Die verbesserte Leistungsfahigkeit des erfindungsgemassen Verfahrens ergibt sich aus der 
Anwendung spezifischer Ligations-Techniken in geeigneter Kombination mit permutations* 
spezifischer Mismatch-PCR. Dabei wird nach selektiver Aufreinigung der 3'-Enden der 
cDNAs an das 5'- und 3'-Ende der Fragmente ein Adaptor-Molektil ligiert. In der folgenden 
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PCR werden Primer eingesetzt, die vorzugsweise je zwei Basen als Permutation aufweisen. 
Die Permutations-Spezifitat der PCR-Primer kann bei hoher Annealing-Ternperatur und 
vorzugsweise bei gieichzeitiger Einfuhrung von artifiziellen Template-Fehipaarungen an 
selektive Oligonukleotid-Stellen deutlich erhoht werden. . 

Durch die erfindungsgemasse Kombination mehrerer Einzelschritte, welche zur , 
Bestimmung von Nukleotid-Sequenzen mittels PCR eingesfetzt werden, zeigt sich ein 
Synergie-Effekt was die Spezifitat der Technik betrrfft. Es ergibt sich eine Art Kontroll- 
Mechanismus fur die einzeinen Prozeduren, da jeder Fehler, der z.B. in der Ligation errolgt, 
durch die selektive PCR mittels Mismatch-Primern korrigiert werden kann. Die 
Permutations-Selektivitat aer PCR wurde durch die bevorzugte Einfuhrung von definierten 
Tempiate-Fehlpaarungen deutlich gesteigert 

Nach einer weiteren bevorzugten Ausfiihrungsform erhalt man durch die Verwendung von 
Permutations-Primern auf beiden Seiten des cDNA-Templates einen Fehler-korrigierenden 
Effekt, da solche Amplifikations-Produkte, welche falschlicherweise mittels eines Oligomers 
in einer der ersten PCR-Runden ersteilt wurden, in ihrer weiteren Vermehrung supprimiert 
werden konnen, falls der Gegen-Primer nur die korrekte Permutation amplifiziert. Ferner ist 
es gemass einer weiteren bevorzugten Ausfuhrungsform durch den geeigneten, 
kcmbinierten Einsatz von Ligations- und PCR-Permutations-Technik bei der DEPD-Methode 
moglich, 9 oder 10 Nukleotide und die Lange eines amplifizierten Fragmentes zu definieren. 
Diese Information sollte zur sicheren Identifikation eines Gens, vorzugsweise mittels 
Datenbank-Analyse, auch dann hinreichend sein, falls sich ein Fehler bei der Bestimmung 
der Basen-Sequenz des cDNA-Fragmentes ergeben sollte. 

Die Anwendung des erfindungsgemassen DEPD-Verfahrens ermogiicht u.a. eine 
umfassende Analyse des Zusammenspiels aller in einem definierten System und/oder in 
einer definierten Situation involvierten Gene auf der Ebene der mRNA-Expressionsmuster, 
wobei fur spezifische und reproduzierbare Ergebnisse lediglich geringe Mengen an Gewebe 
Oder Zellen benotigt werden. Das Verfahren kann in einer Vielzahl von Anwendungsberei- 
chen eingesetzt werden. Hierzu zahlen z.B. der Vergleich von Organen, Geweben, 
Gewebeteilen, Oder von erkrankten Geweben oder Gewebeteilen mit entsprechendem 
gesunden Material, ggfs. auch im Rahmen einer vergleichenden Untersuchung unter 
Verwendung von pharmazeutischen Wirkstoffen gegenuber entsprechenden Kontrollen 
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ohne Wirkstoffapplikation. Ferner ermoglicht das erfindungsgemasse Verfahren einen 
Vergleich von definierten Zustanden in Tiermodellen, wobei hier insbesondere 
vergleichende Analysen von Organen, Geweben, Gewebeteilen oder erkrankten Geweben 
bzw. Gewebeteiien gegentiber entsprechendem gesunden Material bevorzugt sind. Weitere 
Anwendungsgebiete betreffen die Analyse transgener Tiere, welche auch sog. 'knock-out 
Tiere einschliessen, sowie die phanotypische Evaluierung des Einsatzes von Antikorpern, 
Anttsense- und Ribozym-Oligonukleotiden und vergleichbarer Mittel, die im Rahmen von 
funktionellen Ansitzen zur Aufklarung der Relevartz bestimmter Gene eingesetzt werden. 

Der Einsatz einer soichen Technik erlaubt es, die Screening-Geschwindigkeit von zu 
untersuchendem Material deutfich zu erhdhen, da eine Isolierung differentiell exprimierter 
Gene mit anschliessender Klonierung und Sequenzierung nichi mehr notwendig ist. Es ist 
daher moglich, eine viel grossere Zahl an Proben. bzw. weitaus mehr verschiedene Stadien 
einer Probe (z.B: zeitliche V^rlaufe von Verandenijngen der Genexpression uber mehrere 
Stunden/Tage etc.) zu untersuchen. Dies ist nicht riur im Hinblick auf die Entdeckung neuer 
moglicher 'drug targets' wichtig» sondern auch besonders unter dem Aspekt der Aufklarung 
von Wirkmechanismen potentieller therapeutischer Substanzen, da hier bei detailierter 
Untersuchung besonders viel Probenmaterial anfallen kann. 

En weiterer Gesichtspunkt der vorliegenden Erfindung ist deren bevorzugte Anwendung im 
Rahmen eines Datenbank-orientierten Gen-Expressions-Analyse-Verfahrens. Im Gegensatz 
zum enormen technischen Aufwand bereits etablierter Verfahren mit ahnlich hoher 
Leistungsfahigkeit wie z.B. der Ghip-Hybridisierungs-Technoiogie (z.B. Affymetrix, USA), 
von der Chip-Herstellung uber die Auswertungstechnik der Chip-Hybridisierung bis zur 
automatisierten Datenanalyse, stellt das erfindungsgemasse Verfahren eine uberraschend 
einfache und kostengunstige Alternative dar, welche bekannten Verfahren des eingangs 
geschilderten Typs qualitativ deutlich uberlegen ist. 

Nachfoigend wird das erfindungsgemasse Verfahren sowie bevorzugte Ausfiihrungsformen 
desselben im Detail beschrieben. Hinsichtlich detaillierter Angaben zu etablierten Standard- 
Verfahren wird z.B. verwiesen auf J. Sambrook et al.-1989: Molecular Cloning: A Laboratory 
Manual; Coid Spring Harbor Laboratory Press, Cold Spring Harbor, New York. 


BNSDOCID: <WO 994261 0A1_I_> 


WO 99/42610 


- 14- 


PCT7EP99/00992 


Beispiele 

1 ) mRN A-lsolation 

Die isolierung und Aufreinigung von Gesamt-RNA aus zu untersuchenden Geweben, 
Gewebeteiien, Biopsieproben, Zellen etc. erfolgthach beschriebenen Standard-Verfahren. 
Zur vollstandigen Abtrennung von eventuellen Kontaminationen der isolierten RNA mit 
genomischer DNA wird ein enzymatischer Verdau mit DNase! (Boehringer Mannheim, 
Deutschiand) durchgefuhrt. Es folgt dann die Reinigung von PolyA + -mRNA aus der totalen 
RNA mittels Oligo(dT)-gekoppe!ter magnetischer Partikel (Oligo(dT) magnetic beads, 
Promega, Wl, USA). 

2) cDNA-Svnthese 

Doppelstrangige cDNA wird aus rnRNA synthetisiert unter Verwendung einer Mischung aus 
12 Anker-Primern mit foigender Struktur: von 5' beginnend folgt auf ein "Heel^Fragment 
(5*-Extension) aus 5-15 Basen, beisplelsweise 5 Oder 6 Baseri, eine Erkennungssequenz 
fur eines der Restriktions-Enzyme Bsgl oder Eco57l. Anschliessend folgt eine Abfolge von 
14 dT-Nukleotiden und die zwei Anker-Nukleotide V, N am S'-Ende des Primers. Dabei 
bezeichnet V ein Desoxyribonukleotid der Gruppe dA, dC oder dG, wahrend N die 
Desoxyribonukleotide dA, dC, dG und dT definiert. Die Desoxyribonukleotide der dT-Folge, 
gegebenenfalls auch des "Heer-Fragmentes, sind hierbei komplett substituiert durch 2-0- 
methyiierte Ribonukleotide. Der cDNA-Synthese-Primer ist am S'-Ende und/oder an einem 
oder mehreren internen dT-Nukleotiden mit einem Biotin-Rest (C9-Spacer) versehen. 

Alternativ kann die cDNA-Synthese, statt mit a'-O-methylierten Ribonukleotiden, mit einer 
Mischung aus 12 nicht-modifizierien, d.h. aus Desoxyribonukleotiden bestehenden, Anker- 
Primern durchgefuhrt werden. 

3) Erster Verdau der cDNA mit Restriktionsendonukieasen 

Vollstandiger Verdau der cDNA mit einem Restriktionsenzym des Typs IIS, welches 5 
Basen als Sequenz fur die Schnittstelle erkennt (z.B.: Fokl, Bsm Al, Bsm Fl Oder Bbv I) und 
zwei bis vier unbekannte Nukleoticie als Uberhang der cDNA generiert. In den weiteren 
Ausfuhrungen werden beispieihaft Enzyme angefuhrt, die einen Nukleotid-Ueberhang von 4 
Basen generieren. Bei kurzeren Ueberhangen mussen die zu ligierenden Adaptoren 
entsprechend verktirzt werden. 
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4) Erste Adaptoren-Ligation 

a) Durch den Enzym-Verdau entsteht ein S'-Uberhang von vier unbekannten Nukleotiden in 
der cDNA. Sechzehn Adaptor-Molekule, bestehend aus zwei Oligorneren (nicht 5'- 
phosphoryliert, "Pseudo-Doppelstrang'-Adaptoren) werden nach erfolgtem Restriktions- 
Verdau mit der cDNA ligiert. Typischerweise besteht der Adaptor aus zwei unterschiedlich 
langen Oligonukleotiden, wobei das langere aus 25-35, das kurzere (komplementar zum 3'- 
Ende des langeren) aus 8-25 Basen, insbesondere,8-12 Basen, besteht. Der Adaptor 
entsteht durch. Hybridisierung der beiden OKgopukleotide gegeneinander unter geeigneten 
Bedingungen und bildet einen 4-Nukleotid-Uberhang, wobei das Nukleotid 3 bzw. 4 ('innere' 
Nukleotide - relativ zum S'-Ende des antisense-Oligomers) eines der vier moglichen 
Desoxyribonukleotide dA, dC, dG und dT sein kann, wahrend die 'ausseren* Nukleotide 1 
bzw. 2 (relativ zum 5'-Ende des antisense-Oligomers) undefiniert bleiben, d.h. immer als 
Mischung aus der yojlstapdigen Kombination aller vier Desoxyribonukleotide bestehen. So 
entstehen 1,6 permutierte Adaptoren, deren 'innere 1 beiden Nukleotide die Spezifitat der 
Ligation bestimmen. Zur Sicherstellung der korrekten Adaptoren-Ligation werden die 
Ligations-Ansatze nachtraglich mit einer Nuklease, ausgewahit aus der Gruppe bestehend 
aus T4-Endonuclease VII, S1 -Nuclease, und Mung Bean Nuklease, inkubiert 

Die Ligation der 16 permutierten Adaptor-Molekule erfolgt bei 4-37 e C, 1-16 Stunden, 0-150 
mM Na-Acetat, 1-5 Einheiten T4-DNA-Ligase (oder Taq-DNA-Ligase oder E.coli-DNA- 
Ligase) in geeignetem Puffer. Jeder der 16 Ligationsansatze wird nach Aufreinigung in 
einer PCR als Template eingesetzt (siehe (8a)). 

b) Alternativ werden statt 16 schliesslich 64 verschiedene ,, Pseudo-Doppelstrang ,, - 
Adaptoren, welche einen 4-Nukleotid-Uberhang bilden, mit der cDNA ligiert. Dabei setzen 
sich die 64 Adaptoren-Uberhange aus alien Desoxyribonukleotid-Kombinationen der Basen 
2-4 (relativ zum S'-Ende des antisense-Oligomers) zusammen, wahrend das 'aussere' 
Nukleotid (relativ zum 5'-Ende des antisense-Oligomers) als.Mischung aller vier Nukleotide 
eingesetzt wird. Damit bestimmen die Inneren' drei Nukleotide.die Spezifitat der Ligation. 
Dieses Verfahren beruht auf der Erkenntnis, dass die DNA-Ligase aus E.coli die drei ersten 
Basen des Adaptor-Uberhangs in der Ligation zu diskriminieren vermag. Diese erfolgt unter 
den bereits oben beschriebenen Bedingungen. Zur Sicherstellung der korrekten Adaptoren- 
Ligation werden die Ligations-Ansatze nachtraglich mit einer Nuklease, ausgewahit aus der 
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Gruppe bestehend aus T4-Endonuclease VII, S1 -Nuclease, und Mung Bean Nuklease, 
inkubiert. 

c) Alternativ werden statt der Ligation von 1 6 oder 64 verschiedenen "Pseudo- 
Doppelstrang"-Adaptoren die 5- Uberhange der cDNA sukzessive mit Desoxyribonukleotiden 
unter Verwendung von Klenow-DNA-Polymerase aufgefiillt. Dies ist moglich durch den 
Einsatz von Didesoxyribcnukleotiden (ddNTP) und kompetitiven Adaptor-Molekulen. Zudem 
werden die 3-Enden dercDNA nicht von den magnetischen Partikeln eluiert, um die 
eingesetzten Nukleotide nach jedem Schritt entfernen zu konnen. Soil beispielsweise der 
Basen-Uberhang 5'-GGTT-3' aufgefiillt werden, wird die cDNA zuerst mit ddC-Nukleotiden 
inkubiert, um alle Uberhange, welche mit einem dG beginnen zu blockieren. Nach 
Entfernung der Didesxoribonukieotide wird die cDNA mit dA-Nukleotiden inkubiert. Danach 
erfolgt die Ligation eines Adaptor-Molekuls, das ein. 'blunt' und ein 'sticky'-Ende besitzt, an 
diejenigen cNDAs, die bis dahin einen aufgefullten 5-Uberhang aufweisen. Im gleichen 
Schritt werden zwei kompetitive Adaptor-Molekule ligiert. Diese weisen ebenfalls ein 'sticky'- 
Ende auf und einen 5'-Uberhang, der aus einem dC- bzw. drei dC-Molekulen besteht. Diese 
blockieren die cDNA-5'-Uberhange 5'-GTTT-3' bzw. 5'-GGGT-3*. Es folgt eine weitere 
Aufreinigung der Streptavidin-gebundenen cDNA-Fragmente, die dann mit dC-Nukleotiden 
inkubiert wird. Anschiiessend erfolgt die Ligation eines Adaptor-Molekuls mit einem 'blunf- 
Ende, welcher nur an die vollstandig und korrekt aufgefiillte cDNA ligie'ren kann. Auf die Art 
und Weise wird jeder der 256 moglichen cDNA-5'-Uberhange mit DNA-Polymerase komplett 
aufgefiillt und anschiiessend in eine PCR eingesetzt. 

S) Selektive Aufreiniouno der 3'-Enden der cDNA 

Zur Gewahrleistung der selektiven Amplifikation der 3'-Enden der cDNA wird die 
spezifische Aufreinigung dieser Fragmente aus dem Gesamt-Pool der komplexen cDNA 
durchgefuhrt. Die 3'-Enden der cDNA konnen vorzugsweise mit Hilfe von magnetischen 
Partikeln (magnetic beads), welche an Streptavidin gekoppelt sind, aus dem cDNA- 
Gemisch selektiv aufgereinigt werden (s. auch Biomagnetic Techniques in Molecular 
Biology, Dynal, N-0212 Oslo, Norwegen). Diese Art der Aufreinigung stellt sicher, dass in 
der nachfolgenden PCR keine unspezifische Amplifikation von internen (d.h. Nicht-3'- 
Enden) cDNA-Fragmenteh erfolgt. Die Elution der cDNA von den magnetischen Partikeln 
erfolgt entweder durch die Extraktion mit organischen Ldsungsmitteln bei hoher Temperatur 
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(65°C) Oder durch enzymatischen Verdau mit einer der Restriktionsendonukleasen Bsgl 
Oder Eco57l (s.u.). 

6) Zweiter Verdau der cDNA mit Restriktionsendonukleasen fur die Alternative (4b) 
Vollstandiger Verdau der ligierten cDNA mit einem der Restriktionsenzyme Bsgl Oder 
Eco57l. Dabei werden die Oligo-dT-Nukleotide des 3'-Endes der cDNA komplett 
abgespalten und ein 2-Nukleotid-Uberhang den letzten beiden 3'-Basen (V, N) der cDNA, 
welche 5' relativ zum Poly-dA-Stretch der mRNAIiegen, generiert. 

7) Zweite Adaptoren-Liaation fur die Alternative (4b) 

Je vier Adaptoren-Molekule, bestehend aus zwei Oligomeren, werden nach erfolgtem 
Restriktions-Verdau mit je einem Ligations-Ansatz aus (4b) ligiert. Typischerweise besteht 
der Adaptor aus zwei unterschiedlich langen Oligonukleofiden, wobei das langere aus 25- 
35, das kurzere (kompjementar zum 3'-Ende de&langeren, S'-phosphoryliert) aus 22-30 
Basen besteht. Der Adaptor entsteht durch Hybridisierung der beiden Oligonukleotide 
gegeneinander unter geeigneten Bedingungen und bildet ein 2-Nukleotid-Uberhang, wobei 
das 'aussere' 3-Nukleotid eines der vier Desoxyribonukleotide dA, dC, dG oder dT sein 
kann, wahrend das Innere' Nukleotid aus einer Mischung der drei Basen dA, dC oder dG 
definiert ist. Somit bestimmt das 'aussere* 3'-Nukleotid des Adaptor-Uberhangs die 
Spezifitat der Ligation. Die Ligations-Bedingungen sind wie oben beschrieben. Jeder der 
256 Ligationsansatze wird nach Aufreinigung in eine PCR als Template eingesetzt (siehe 
(8b)). 


8a) PCR fur die Alternative (4a) 

In insgesamt 256 - 1024 PCRs wird als S^Primer der komplett durch 2'-0-methylierte 
Ribonukleotide substituierte cDNA-Synthese-Primer (Mischung aus 1 2 Anker-Primern) 
verwendet. Dabei kann durch die erhohte Dissoziations-Temperatur der modifizierten Basen 
des Oligonukleotides eine deutlich hohere (bis zu 40 %, s. z.B. L.L. Cummins 1995, Nucl. 
Acids Res., 23, 2019-2024) Annealing-Temperatur in der PCR verwendet werden als mit 
einem nicht-substituierten Primer. 

Ein Aliquot der unter Punkt (4a) generierten Ligations-Ansatze wird in der PCR eingesetzt. 
Als S'-Prirner werden entweder in einer ersten PCB-Runde 16-64 Oligomere der Lange 18- 
27 Basen, die dem 3'-Ende des Sense-Adaptor-Oligonukleotids mit zusatzlich zwei oder 
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arei 3'-Nukieoticien der vollstandigen Permutation aller vier Desoxyribonukleotide dA, dC, 
dG und dT entsprechen, verwendet/ Die hier eingesetzten Primer-Pemriutationen 
enisprechen dabei den in den Ligations-Ansatzen unter (4a) definierten Basen 3 - 4 oder 2 
- 4 der Adaptoren-Uberhange. In einer zweiten sich anschiiessenden PCR-Runde. werden 
pro erste PCR weitere 16 Oder 64 PCRs durchgefuhrt mit demselben 3'-Primer und je 16 5'- 
OHgonukleotiden der Lange 18-27 Basen, die dem 5'-Primer der ersten PCR entsprechen, 
jedoch um zwei Oder drei 5*-Nukleotide der vollstandigen Permutation aller vier 
Desoxyribonukleotide dA, dC, dG und dT verlangert sind. 

Zur Gewahrleistung der Spezifitat der Amplifikation der verschiedenen Permutationen in der 
PCR werden selektive PCR-Primer verwendet, welche mehrere artifiziell eingefuhrte 
Fehlpaarungen gegeniiber der Template-DNA enthalten konnen. Diese Mismatches konnen 
sich an irgendeiner Steile des Oligomers befinden, wobei 2 Mismatches an den Positionen - 
2 und -3 cder 1 Mismatch an der Position -1 relativ zum 3'-Ende des Primers. (Position 0) 
bevorzugt sind. 

Das PCR-Prof il ist typischerweise: 3 min, 95 9 C gefolgt von 20-40 Zyklen mit 45 sec, 95 S C, 
45 sec, 65 e C, 60 sec, 72 9 C und einer abschiiessenden Extension fur 60 sec bei 72 e C, und 
wird mit Hilfe von radioaktiv oder fluoreszierend markierten PCR-Primern durchgefuhrt. 

8b) Weitere Moalichkeit einer PCR fur die Alt ernative (4a) 

Alternaiiv wird die PCR wie unter 8a) beschrieben durchgefuhrt, wobei jedoch ein nicht- 
modifizierter cDNA-Synthese-Primer (Mischung aus 12 Anker-Primern), welcheraus 
Standard-DesOXyribonukleotiden besteht eingesetzt. 

8c) PCR fur die Alternative (4b) 

In insgesamt 256 PCRs werden 64 5'-Primer der Lange 18-27 Basen, die dem 3'-Ende des 
Sense-Oligonukleotids des ersten ligierten Adaptor-Molekuls (s. (4b)) mit zusatziich drei 3'- 
Nukleotiden der vollstandigen Permutation aller vier Desoxyribo-nukleotide dA, dC, dG und 
dT entsprechen, verwendet. Die hier eingesetzten Primer-Permutationen entsprechen dabei 
den in den Ligations-Ansatzen unter (4b) definierten Basen 2-4 der Adaptoren-Uberhange. 
AJs 3'-Primer werden vier Oligonukleotide der Lange 18-27 Basen, die dem 3'-Ende des 
Sense-Oligonukleotids des zweiten ligierten Adaptor-Molekuls (s. (7)) entsprechen, 
eingesetzt. 
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Das PCR-Profil ist typischerweise: 3 min, 95 S C gefoSgt von 20-40 Zyklen mlt 45 sec, 95 e C, 
45 sec, 65 C C, 60 sec, 72 S C und einer abschliessenden Extension fur 60 sec bei 72 9 C, und 
wird mit Htffe von radioaktiv oder fluoreszierend markierten PCR-Primern durchgefuhrt 

8d) PCR fur die Alternative 74c) 

in insgesamt 256 PCRs (fur jede 'Auffuilreaktion' eine PCR) wird ein S'-Primer der Lange 
18-27 Basen, die dem 3'-Ende des Sense-Oligonukleotids des ligierten Adaptor-Molekiils 
entspricht, eingestzt. Als 3'-Primer wird das cDNA-Synthese-Oligonukleotid verwendet. 
Das PCR-Profil ist typischerweise: 3 min, 95 C C gefolgt von 20-40 Zyklen mit 45 sec, 95 e C, 
45 sec, 65 Q C, 60 sec, 72 9 C und einer abschliessenden Extension fur 60 sec bei 72 9 C, und 
wird: in Gegenwart von radioaktiv markierten Nukleotiden durchgefuhrt. 

91 PCR-Anatyse 

Die Analyse der PCR-Fragmente erfolgt typischen^eise auf 6 %-igen Polyacrylamidgelen 
(PAA-Gelen) mit 7-8 M Harnstoff oder durch Kapillar-Elektrophorese. 

Aus den Ergebnissen zeigt sich, dass die Selektivitat fur die Amplifikation der korrekten 5'- 
Nukleotide der cDNA fur die S'-Primer der TOQA-Methode nicht hinreichend gegeben ist, 
insbesondere wenn die Durchfuhrung einer Computer-gestutzten Datenbank-Analyse der 
Resultate angestrebt wird. Die Fehler-Rate bei der erfindungsgemassen Verwendung der 
S'-Primer betragt * 5 %. Die Fehler-Rate lasst sich durch die oben beschriebene Liagtions- 
Methode weiter reduzieren auf annahemd 0 %. Angesichts dieser extrem niedrigen Fehler- 
Rate wird auch die Etablierung einer automatisierten Daten-Analyse ermoglicht. 
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Patentanspruche 

1 . Verfahren zur Identifikation und Charakterisierung von mRNA-Molekulen, welches die 
folgenden Schritte umfasst: 

(a) Isolierung und Reinigung von PolyA+-RNA aus Gewebeproben; 

(b) Synthese von doppelstrangiger cDNA aus den mRNA-Molekulen; 

(c) Verkurzen der cDNA durch enzymatischen Verdau mit Restriktionsendonukleasen; 

(d) Hybridisierung und Ligation von Adaptor-Molekulen an die geschnittene cDNA; 
und entweder, in einer 1 . Alternative, 

(e) Auffullen der 5'-Uberhange der cDNA mit Desoxyribonukleotiden und Klenow-DNA- 
Polymerase; 

(f) selektive Auf reinigung der 3'-Enden der cDNA; 

(g) Abtrennung der 3'-standigen Poly-dA-Nukleotide, der cDNA durch enzymatischen 
Verdau mit einer Restriktionsendonuklease; 

(h) Hybridisierung und Ligation von Adaptor-Molekulen an die geschnittene cDNA; 

(i) Amplifizierung der cDNA-Fragmente durch PCR (polymerase chain reaction); 
(j) Auftrennung der Amplifikationsprodukte nach ihrer Lange; 

(k) Analyse der Amplifikationsprodukte; 
Oder, in einer 2. Alternative, 

(e) selektive Auf reinigung der 3'-Enden der cDNA; 

(f) Abtrennung der3'-standigen Poly-dA-Nukleotide der cDNA durch enzymatischen 
Verdau mit einer Restriktionsendonuklease; 

(g) Hybridisierung und Ligation von Adaptor-Molekulen an die geschnittene cDNA; 

(h) Amplifizierung der cDNA-Fragmente durch PCR (polymerase chain reaction), 
wobei 5'-Primer verwendet werden, die zwei oder drei Permutationen am 3 ! -Ende 
aufweisen, und die eine oder zwei artifizielle Fehlpaarungen im Vergleich zum durch 
die Adaptermolekule bestimmten komplementaren Strang enthalten; 

(i) Auftrennung der Amplifikationsprodukte nach ihrer Lange; 
(j) Analyse der Amplifikationsprodukte; 

oder, in einer dritten Alternative, 

(e) Amplifizierung der cDNA-Fragmente durch PCR (polymerase chain reaction), 
wobei S'-Primer verwendet werden, die zwei Oder drei Permutationen am 3*-Ende 
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aufweisen, und die eine oder zwei artifizielle Fehlpaarungen im Vergleich zum durch 
die Adaptermolekiile bestimmten komplementaren Strang enthaften; 

(f) Auftrennung der Amplifikationsprodukte nach ihrer Lange; 

(g) Analyse der Amplifikationsprodukte; 

wobei fur die 1 * und 2. Alternative in Schritt (b) die Synthese der cDNA- 
Erststrangmoiekule durch reverse Transkription unter Verwendung eines geankerten 
Oligo-dT-Nukleotids erfolgt, welches eine 3'-Extension von 2 Basen aufweist, wobei 
die erste Base dA : dC oder dG, und die zweite^Base dA, dC, dG Oder dT ist, und 
welches eine 5 -Extension von 5-15 Basen aufweist, die fur die Schnittstelle einer 
Restriktionsendonuklease mit der Spalt-Charakteristik 1 6/1 4 'downstream' der 
Erkennungssequenz kodiert; oder 

wobei fur die 3. Alternative in Schritt (b) die Synthese der cDNA-Erststrangmolekule 
■ durch reverse Transkription unter Verwendung eines geankerten Oligo-dT-Nukleotids 
erfolgt, welches eine 3-Extension von 2 Basen aufweist; wobei die erste Base dA, dC 
oder dG, und die zweite Base dA, dC, dG oder dT ist, und welches eine 5-Extension 
von 5-1 5 Basen einer beliebigen Sequenz aufweist. 

2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass das Oligo-dT-Nukleotid 
vcllstandig durch 2-O-methylierte Ribonukleotide substituiert wird. 

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass das Oligo-dT- 
Nukleotid an seinem freien 5*-Ende und/oder an internen dT-Nukleotiden mit einem 
Biotinrest uber einen C9-Spacer versehen wird; 

4. VerfaHren nach Anspruch 1 , wobei in Schritt (h) der 2. Alternative oder in Schritt (e) 
der 3. Alternative sich die Fehlpaarungen an den Positionen -3, oder -3 und -4, Oder - 
4 und -5 im Vergleich zum durch die Adaptermolekule bestimmten komplementaren 
Strang befinden. 

5. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass in Schritt (c) ein 
Restriktionsenzym der Klasse IIS verwendet wird, welches 5 Nukleotide als 
Erkennungssequenz besitzt und einen aus 2 - 4 Nukleotiden, die nicht Teil der 
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Erkennungssequenz sind. bestehenden Uberhang der geschnittenen cDNA- 
Fragmente generiert. 

6. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass in Schritt (f) der 1 . 
Alternative oder in Schritt (e) der zweiten Alternative die selektive Aufreinigung der 3'- 
Enden der cDNA unter Verwendung von paramagnetischen 'beads' erfolgt, die das 
Biotin-bindende Molekul Streptavidin gekoppelt haben. 

7. Verfanren nach Anspruch 1 , dadurch gekennzeichnet, dass in Schritt (g) der 1 . 
Alternative oder in Schritt (f) der 2. Alternative ein Restriktionsenzym der Klasse IIS 
verwendet wird. 

8. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass die Produkte aus Schritt 
(d) oder aus Schritt (h) der 1 . Alternative oder aus Schritt (g) der 2. Alternative vor der 
Amplifizierung gemass Schritt (ij mit eirter Nuklease, ausgewahlt aus der Gruppe 
bestehend aus T4-Endonuclease VII, S1 -Nuclease, und Mung Bean Nuclease, 
inkubiert werden. 

9. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass in Schritt (i) der ersten 
Alternative oder in Schritt (h) der 2. Alternative oder in Schritt (e) der 3. Alternative die 
Amplifizierung der cDNA-Fragmente unter Verwendung von Oligonukleotiden erfolgt, 
die an den kompiemeniaren Strang des 'sense'-Oiigomers der ligierten Adaptor- 
Molekule hybridisieren. 

1 0. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass in Schritt (k) der ersten 
Alternative oder in Schritt Q) der 2. Alternative oder in Schritt (g) der 3. Alternative die 
Analyse anhand der unterschiedlichen Langen der Produkte sowie in Kenntnis der 
durch die Manipulation bekannten Basensequenz von 9 oder 10 Nukleotiden erfolgt. 

1 1 . Anwendung des Verfahrens nach einem der vorhergehenden Anspruche zur 
gegebenenfalis rechnergestutzten Identifizierung und Isolierung sowie Analyse neuer 
Gene. 
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